home *** CD-ROM | disk | FTP | other *** search
/ SGI Varsity Update 1998 August / SGI Varsity Update 1998 August.iso / docs6.4 / relnotes / SpeedShop / ch5.z / ch5
Text File  |  1998-07-29  |  8KB  |  199 lines

  1.  
  2.  
  3.  
  4.                                   - 1 -
  5.  
  6.  
  7.  
  8.        5.  _K_n_o_w_n__P_r_o_b_l_e_m_s__a_n_d__W_o_r_k_a_r_o_u_n_d_s
  9.  
  10.           +o MPI 3.1.x.x reorganizes the dynamic objects specified
  11.             by _RLD_LIST and breaks ssrun's interposition
  12.             (incidents #567877 and #599278).  The workaround is to
  13.             set environment variable MPI_RLD_HACK_OFF.
  14.  
  15.           +o Any SpeedShop experiment will not produce data if the
  16.             process is killed with a SIGKILL signal. Therefore, any
  17.             experiment run under the WorkShop debugger will not
  18.             produce data if the process is killed from the user
  19.             interface.  Doing so sends a SIGKILL, which can not be
  20.             caught, so that the data is lost.  The workaround is to
  21.             kill the process by sending it a ctrl-C signal
  22.             (SIGINT).
  23.  
  24.           +o _s_s_r_u_n -_i_d_e_a_l will not produce an experiment if it is
  25.             run in a directory where a previous direct invocation
  26.             of _p_i_x_i_e was done on the same executable.  It will not
  27.             add the SpeedShop runtime, but will produce a .Counts
  28.             file instead.  Workaround is to remove the pixified
  29.             executable before invoking _s_s_r_u_n.  [Incident 517224]
  30.  
  31.           +o Executables built non-shared are not generally
  32.             supported (except for direct _p_i_x_i_e use).
  33.  
  34.           +o Usertime experiments on o32 programs can not collect
  35.             callstacks unless the executable has been explicitly
  36.             linked with -_l_e_x_c.  [Unfixable;  a fix would increase
  37.             the size of all executables, and is considered
  38.             undesirable for that reason.]  The symptom of such
  39.             experiments is that all time is attributable only to
  40.             the current PC, with no attribution to callers at all.
  41.  
  42.           +o On o32 programs there is no accurate way of unwinding
  43.             the stack in the prologue or epilogue using the PDR's.
  44.             Usertime experiments might fail to correctly unwind the
  45.             stack if the program is interrupted inside the prologue
  46.             or epilogue of a function.  [Incident 366232]
  47.  
  48.           +o Usertime experiments might fail inside function
  49.             _u_s_i_n_i_t() in n32/n64 _l_i_b_c._s_o._1 on IRIX 6.2 because of
  50.             incorrect dwarf information.  [Incident 439873]
  51.  
  52.           +o Programs using _l_i_b_m_p._s_o and _l_i_b_f_t_n._s_o might not produce
  53.             complete experiment files if they are terminated with
  54.             SIGINT.  As a workaround, environment variable
  55.             _SPEEDSHOP_SHUTDOWN_SIG can be used.  [Incident 406405]
  56.  
  57.           +o _p_r_o_f does not handle the -dis or -source options for
  58.             call stack trace experiments.  [Incident 409155]
  59.  
  60.  
  61.  
  62.  
  63.  
  64.  
  65.  
  66.  
  67.  
  68.  
  69.  
  70.                                   - 2 -
  71.  
  72.  
  73.  
  74.           +o _p_r_o_f does not handle the -h or -l options for call
  75.             stack trace experiments.  [Incident 531749]
  76.  
  77.           +o _p_r_o_f on usertime experiments will overcount inclusive
  78.             time (and on fpe experiments might overcount inclusive
  79.             fpes) on programs that have recursive functions.  Each
  80.             level of recursion will count for each callstack.  This
  81.             may lead to functions whose inclusive time greatly
  82.             exceeds the actual runtime.  [Incident 438769]
  83.  
  84.           +o Butterfly display in _p_r_o_f needs to show more
  85.             descriptive information, including the callsite
  86.             addresses and the invocation counts.  [Incident 527599]
  87.  
  88.           +o _p_r_o_f doesn't always handle correctly hidden symbol
  89.             resolution between dso's when associating performance
  90.             numbers with those symbols, so there may be some
  91.             inaccuracies for those symbols that have multiple
  92.             definitions from different dso's.  [Incident 562642]
  93.  
  94.           +o _p_r_o_f has still some performance problems.  [Incident
  95.             537714]
  96.  
  97.           +o Some marching orders combinations in experiment files
  98.             cause _p_r_o_f to break.  [Incident 578807]
  99.  
  100.           +o The butterfly views produced by prof may be incorrect
  101.             for some symbols.  [Incident 579434]
  102.  
  103.           +o _p_r_o_f -feedback may core dump in some cases.  [Incident
  104.             594034]
  105.  
  106.           +o _p_r_o_f doesn't yet use targinfo to simulate the hardware
  107.             architecture when processing ideal experiment data, so
  108.             some cost attributions may be inaccurate.  [Incident
  109.             505566]
  110.  
  111.           +o Ideal experiments might not produce correct call counts
  112.             for procedures with multiple entry points and might
  113.             miss some intra-DSO calls.  [Incident 260827]
  114.  
  115.           +o Totaltime experiments on IRIX 6.2 or later and hwctime
  116.             experiments on IRIX 6.5 or later might produce biased
  117.             performance data for programs using pthreads, since
  118.             ITIMER_REAL in this case is asynchronous and SIGALRM
  119.             gets delivered to the process (and not to all the
  120.             uthreads) and he o/s hw counter access interface does
  121.             not provide per-uthread controls.  [Incident 477551]
  122.  
  123.           +o _f_p_c_s_a_m_p (1 msec sampling) experiments on R10000 systems
  124.             on IRIX 6.2 or 6.3 might produce inconsistent
  125.  
  126.  
  127.  
  128.  
  129.  
  130.  
  131.  
  132.  
  133.  
  134.  
  135.  
  136.                                   - 3 -
  137.  
  138.  
  139.  
  140.             performance results because of a kernel bug.  [Incident
  141.             409775]
  142.  
  143.           +o There is a potential problem with ideal experiments and
  144.             instrumentation on MPI programs running on different
  145.             hosts but under the same (NFS-mounted) directory. There
  146.             may turn out to be two _p_i_x_i_e executables running on two
  147.             different hosts, producing a.out.pixie into a single
  148.             nfs-mounted directory at the same time. For DSOs, the
  149.             problem is more complex, because there may be two
  150.             different libc's involved, one from each host, but
  151.             _p_i_x_i_e is producing a libc.so.1.pix32, and only one can
  152.             live in the directory. As a workaround, the user can
  153.             specify a different directory on each host using _m_p_i_r_u_n
  154.             -d.  [Incident 506183]
  155.  
  156.           +o Performance analysis using either prof or WorkShop's
  157.             performance analyzer can only happen on the host that
  158.             generated the experiment files. For kernel profiling
  159.             experiments there's a workaround described in this
  160.             section.
  161.  
  162.           +o If a kernel profiling experiment has been run on a
  163.             remote system or on the same system but using a
  164.             different kernel file than "/unix", then the kernel
  165.             file name should be provided as a command-line argument
  166.             to prof (or, if WorkShop's performance analyzer is used
  167.             to process the experiment file, the kernel file should
  168.             be copied into the same directory as the experiment
  169.             file and should be renamed to "unix").
  170.  
  171.           +o Usage and heartbeat data include resources used up by
  172.             instrumentation, so their values do not accurately
  173.             reflect the performance data of just the target
  174.             application for those experiments that require binary
  175.             code instrumentation.  [Incident 577985]
  176.  
  177.           +o SpeedShop doesn't support per-pthread performance data
  178.             for all experiments. Only usertime, totaltime, hwctime,
  179.             fpe, io and heap experiments tag collected data with
  180.             pthread ids for later per-pthread analysis.  [Incident
  181.             476886]
  182.  
  183.           +o PVM support is under investigation.  [Incident 581107]
  184.  
  185.           +o The 6.5 MR corded libSgm.so.1 fails when pixified.
  186.             [Incident 608528]
  187.  
  188.  
  189.  
  190.  
  191.  
  192.  
  193.  
  194.  
  195.  
  196.  
  197.  
  198.  
  199.